摩尔定律促进人工智能大发展
2016年是人工智能(AI)60周年,一个甲子。同时,著名的摩尔定律也有50多年的历史。尽管人工智能和摩尔定律携手走过了半个多世纪,却很少有人了解它们之间的关系。其实它们之间绝不是独立发展的,那么,摩尔定律和人工智能有什么交集呢?
从20世纪50年代起,人们开始研究人工智能,但那时的研究只是集中在逻辑推理上,只是成功地利用计算机进行了逻辑定理证明。后来,由于问题的复杂度大大超过当时计算机(二代机和三代机)的处理能力,因此到了70年代,人工智能就发展不下去了,处于低谷期。80年代开始了以专家系统为代表的知识工程,发展了七八年,非常红火。到了80年代末期,随着消费级个人电脑(PC)的兴起,大家发现,原来在IBM的个人电脑上也可以运行很多提高生产力的应用,而为专家系统打造的机器太贵,由此出现了一个低成本颠覆,这让人工智能陷入了第二个冬天。1993年,英特尔发布了奔腾处理器,这是一个划时代的处理器,让个人电脑级的系统具有很强的计算力。当时正在研究神经网络的学术界,终于有了合适的消费级计算机做实验,这样才有了之后二十几年逐渐发展起来的神经网络的研究。
摩尔定律指出,每隔18~24个月,同样计算力的芯片可以用一半左右的价格买到,这是通过在同样的芯片面积上放置更多的晶体管并保持高能效来实现的。那么,2000年以后,摩尔定律是怎样的呢?到2000年以后,芯片工艺达到90纳米以下时,其制造遇到了很多问题,有很多猜测说摩尔定律延续不下去了。但是,科学家和工程师一次又一次地努力,在新材料、新技术上进行探索。在突破45纳米节点的时候,英特尔采用高K-金属栅极技术,克服了漏电问题。在突破22纳米节点的时候,又发明了3D晶体管,让一个晶体管的尺寸变得更小。就这样,不断地把摩尔定律往前一步步推进,突破了很多瓶颈。目前,芯片工艺已经达到7纳米的水平。这20年里,计算机和手持设备的性能不断提升,单位计算能力提高了15000倍。现在,手持设备的计算性能已经堪比当年的服务器。摩尔定律也推动了存储容量的大幅上升,成本大幅下降。从1995年1GB存储需要1000美元,到2015年只需要3美分,单位存储成本约为当时的1/30000。这些极大地促进了基于大数据和计算力的人工智能算法的研究。
预计到2020年,人工智能方面需要的计算力将增长12倍。这会给我们带来一个完全不一样的世界。以精准医疗应用为例,做基因组测序、分析医疗影像数据以及处理实验室检测的数据等等都需要大量的运算。上述工作原来需要几天才能完成,而现在,在人工智能技术的帮助下只需要几个小时就能完成。现在,人工智能已经达到了应用爆发的临界点,后面还会有越来越强的计算能力,越来越多的数据以及算法的突破。
突破计算力和算法瓶颈,数据洪流引爆人工智能
深度学习是神经网络的一个升级换代版本。随着算法创新,深度神经网络可以做得更深更宽,同时通过足够快的运算力、足够大的存储,能够在可用的时间内训练出适应某种具体应用的模型,从而在行业应用中落地。深度学习特别适合处理图像数据。过去几年里,计算机在某些视觉识别任务中的准确度已经做到比人还好,由此为我们带来了对未来智能时代很强的预期。
随着传感器技术和无线通讯技术的提升,有越来越多的数据可以被采集。例如,用手机一拍就是几兆的相片,随便一录就是几十兆的视频。预计到2020年,一个互联网用户每天将产生1.5GB的数据。一家医院可以把所有的设备联网,并把核磁共振成像等医疗数据放到网上,这样一天可以产生3TB的数据。无人驾驶汽车一天就能产生4TB的数据,而且这些数据是多样化的,不再是以前计算机处理的结构化数据。这些实时产生的数据包括摄像头数据、超声波雷达数据、多线激光雷达数据等等,各种数据的频率、格式都不一样,而且会有误差,所以需要排除噪音进行解读。由此形成的大数据洪流为人工智能的爆发提供了另一个基础。
目前,人工智能处于一个技术升级的阶段,从技术升级跨越到产业升级才能实现真正的影响力。各行各业涉及很多具体的应用,每一个应用都会有专门的端到端的数据处理、分析、展现的要求,每一个应用实际上都需要不同的研发人员来使用人工智能技术把它做好。由此提出了两个要求:一是人工智能的能力要增强,而且要加速适应到不同行业里去;二是要能够让更多的人很方便地使用人工智能的技术。这两点是人工智能普及和民主化的重要因素。
人工智能民主化需要闭环
人工智能既有前端的设备,又有后端的云,应该把人工智能放在哪里?是放在前端的设备里面,还是放在云端?这并没有一个通用准则,需要具体问题具体分析。例如,英特尔收购了Mobileye,有人说这是买了一张进军自动驾驶领域的票。但是,自动驾驶是不是Mobileye一家的能力就够了?肯定不够。一辆汽车要自动跑起来,需要模拟人的视觉、听觉和其他感知能力,对环境进行建模,还要快速作出智能的判断来操控车辆。环境建模需要与传感器数据相融合,这些数据不仅有图像数据,还有来自超声波、激光雷达的数据,所有这些不同的数据都需要做不同的处理。自动驾驶如果出现问题就会关乎人命,因此控制系统的反应速度非常重要。而自动驾驶汽车(也即前端设备)本身也一定要有足够强的实时处理能力。
同时,在很多场景下,云端仍然非常有用。例如,汽车终端收集的数据要放在云端做综合处理,这样可以为整个城市的交通做更好的规管。在云端,还可以汇总很多汽车上传的各种边界情况,然后把这些数据作为自动驾驶训练边界情况的处理模型,最终把新的模型下载到所有汽车上来提高应变能力。因此,根据情况,人工智能既可在云端,也可在前端,而且最优的方案是两者都部署。
在为人工智能相关产品的市场提供解决方案时,必须根据实际需要提供远端、终端乃至边缘计算的硬件支持。在云端需要多种支持人工智能计算的方法,除了深度学习训练任务,在实际应用中还需要对大量的视觉、声音、文字等各种数据做预处理和后处理,并对处理的结果进行归纳和推理。此外,还会有通用计算的需求,如数据库处理和业务软件。所以在整个云端的计算架构中,需要合理配置通用计算硬件和专门针对某些工作负载的加速硬件。
人工智能民主化需要形成“闭环”,如图1所示。这个环从前端的数据采集开始,经过移动计算和数据通讯网络上传到云端,在云端做更大量的优化训练,再下发到前端。我们认为,这个环必须时刻运转,不需要停止,也不能停止。在这个环上,用户需要很多种不同级别的软硬件加速方案。因此,被英特尔收购后的Mobileye也只是其中的一个方案,并非全部,而全部的方案需要很多技术去综合配合,才能让无人驾驶应用真正实现产业化落地。
图1 通过终端与云端形成闭环促成人工智能民主化
重视开源和生态
开源和生态在人工智能领域非常重要,尤其需要支持开源框架,并整合大数据处理流程。因为人工智能处理的是整个数据处理链条中的一个环节,而要构造一个完整的应用,则需要经历采集数据、分类数据、过滤数据(比如去除一些涉及隐私的数据)等流程,然后才会交给人工智能模块做处理。输出也要配合其他数据做融合,还要以某种方式可视化,或者以可控制的方式反馈给系统。所以,整个处理链条仍然和以前的大数据业务十分类似,只不过在中间加入了人工智能赋予的一些能力。需要通过多层软硬件组合来建立开源生态,如图2所示。
图2 通过多层软硬件组合建成开源生态
支持人工智能相关计算的硬件产品很多,要很方便地使用这些硬件,硬件之上的软件堆栈非常重要。否则,一来不能充分释放硬件的能力,二来影响产品研发的效率。以英特尔支持人工智能的软硬件产品为例,中间三层就是软件的堆栈。在库这一层,会隐藏不同硬件的差异,让上层的框架能够以同样的方式去使用底层硬件的能力。其中最新的关联记忆库,可以利用更长期的语义层级的记忆去发现可能存在的一些模式和规律。中间框架层可以支持多种流行的开源深度学习框架和大数据模型,可以让用户把在其他框架下开发出来的模型迅速地部署在英特尔的平台上。工具层能够让用户更快速地将一些最新的方案应用到自己的系统和方案里。最上层则必须按照不同行业应用的要求去优化整个堆栈,形成解决方案。
分享互助的开发者社区有利于构造健康的人工智能产业生态。例如,英特尔提出的BigDL框架,就是为了方便以前使用Spark这种开源框架的用户去开发各种数据处理软件,让他们可以无缝使用深度学习和人工智能带来的一些能力,这也是让人工智能民主化的一个很好的例子。为了方便更多的初学者和其他领域的爱好者深入了解如何使用人工智能和相关的软硬件产品与工具,英特尔开设了一个人工智能学院。在这个学院里,除了有线上的培训工具,还有很多线上课程,让大家自己学习人工智能的基本理论、工具和模型。不仅如此,在人工智能学院里还有社区,用户能在这里和行业伙伴以及技术专家一起讨论怎样更快地进行协作。
我们当前正处在人工智能技术升级的当口。像人工智能这样大的一个产业,要实现产业成功升级,只有一家公司是不够的,需要大家共同合作来支持开放的数据交换和知识共享。
引导人工智能,承担社会责任
人工智能是一个非常具有颠覆性的技术,和之前的一些创新科技一样,可以用在好的地方,也可以被人用在坏的地方。具备社会责任感的公司和机构一定要推动产业合作,让人工智能用在正确的地方,发挥积极的作用。一个积极的例子是利用人工智能推进疾病治疗。例如,英特尔在美国与一些医疗机构合作,利用大数据和人工智能,开展了治疗帕金森症的项目,还有协作式的癌症云。另一个例子是在知识产权和隐私保护方面与京东合作,使用人工智能很好地应对了2016年“双十一”侵权和非法图片使用的问题。在“双十一”时,有数以亿计的用户和商家一起在网上发布图片,单靠人力无法快速准确地筛选出其中有知识产权问题或者非法的图片。而通过使用硬件加速方案,使处理速度提升了4倍,很好地解决了这一问题。
广泛合作,助力人工智能发展
英特尔中国研究院在人工智能方面也进行了深入的研究,主要涉及三个方面:计算机视觉人脸技术、多模态环境理解、自适应人机交互。基于视觉的人脸技术中基本的检测、跟踪等已经进入产品。目前,在人脸表情的识别方面,我们已经在国际学术比赛上取得第一、第二的好成绩。从视觉理解扩展而来的多模态物体识别、环境理解等技术,对于建设平安城市的数字监控系统和无人驾驶系统都非常重要,需要把技术升级带到产业升级里。第三个和人工智能相关的就是服务机器人的自然交互能力,也称为自适应的人机交互。目前,在机器人上基于人工智能的功能实际上是针对某些具体的需求来训练一些能力,通常不能保证百之分百可靠,特别是在遇到一些新的场景或者在一些并不太好的视角时,置信度不是很高。但是,在产品级应用中,机器人必须提供一致的用户体验,不能因为看不清就不做。对此,我们将人工智能技术和与人的智能交互结合起来,去弥补人工智能的不足。换句话说,充分利用人的智能,在人工智能能力不足的某些情况下进行补足,提供最优的用户体验。这个思想不只局限于服务机器人,对于需要“人工智能+”的产业应用,把人工智能技术与多种可用的技术融合,包括利用人在环中(human in the loop)的特点,真正做出稳定可靠、用户体验一流的应用,是通过人工智能促进产业升级的王道。
目前,人工智能已经发展到了一个转折点,我们都希望这一波热潮能够持续下去,不会又因为一些不确定的因素再进入一个冬天。所以,更需要大家一起合作,把学术、技术的升级真正应用到产业里面,变成产业的升级。因为只有产业才能真正推动技术的发展。人工智能必须与各行业中的应用需求整合,这需要提供底层硬件技术的公司与产业链上的其他公司通力合作,包括互联网公司、内容提供商、垂直服务商等,以及大学和科研机构。人工智能的合作目标是让人工智能创新可以在多个不同的行业中开展生态合作和应用,从而实现社会价值最大化,促进产业的升级。
致谢:本文为作者在2017新智元技术峰会的主旨演讲,感谢新智元提供现场速记材料。
所有评论仅代表网友意见